Noms propres, syntagmes nominaux, expressions référentielles : repérage et codage
Identifieur interne : 000045 ( France/Analysis ); précédent : 000044; suivant : 000046Noms propres, syntagmes nominaux, expressions référentielles : repérage et codage
Auteurs : F. Bruneseaux [France]Source :
- Cahiers d'études et de recherches francophones. Langues [ 1291-1542 ] ; 1998.
Descripteurs français
- Pascal (Inist)
- Wicri :
- topic : Codage.
English descriptors
Abstract
Parmi les avantages qu'offre la version informatisée d'une ressource linguistique, il y a, entre autres, la possibilité d'enrichir le document d'annotations spécifiques qui ne se limitent pas à un simple repérage de début/fin de sections ou de paragraphes. Dans cet article, nous aborderons plus précisément le problème du repérage et du codage des noms propres, syntagmes nominaux et expressions référentielles. Cependant, si l'annotation des noms propres peut être intéressante à des fins multiples (résumés automatiques, recherche dans des bases de données, etc.), on verra que dans les faits un tel travail suppose une bonne réflexion sur ce que l'on doit effectivement coder. C'est pourquoi, en nous appuyant sur les recommandations de la TEI (Text Encoding Initiative), nous faisons des propositions afin d'aller au-delà des possibilités actuelles et d'offrir ainsi un schéma qui permette d'affiner le codage en fonction du niveau d'analyse auquelle nom propre est appréhendé, distinguant entre nom propre élément d'un syntagme nominal ou d'une expression référentielle.
Affiliations:
Links toward previous steps (curation, corpus...)
- to stream PascalFrancis, to step Corpus: 000059
- to stream PascalFrancis, to step Curation: 000070
- to stream PascalFrancis, to step Checkpoint: 000066
- to stream Main, to step Merge: 000433
- to stream Main, to step Curation: 000403
- to stream Main, to step Exploration: 000403
- to stream France, to step Extraction: 000045
Links to Exploration step
Francis:524-99-13508Le document en format XML
<record><TEI><teiHeader><fileDesc><titleStmt><title xml:lang="fr" level="a">Noms propres, syntagmes nominaux, expressions référentielles : repérage et codage</title>
<author><name sortKey="Bruneseaux, F" sort="Bruneseaux, F" uniqKey="Bruneseaux F" first="F." last="Bruneseaux">F. Bruneseaux</name>
<affiliation wicri:level="1"><inist:fA14 i1="01"><s1>Centre de recherche en informatique de Nancy (CRIN), Bâtiment LORIA, BP 239</s1>
<s2>Vandœuvre-Lès Nancy 54 506</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
<country>France</country>
<wicri:noRegion>Vandœuvre-Lès Nancy 54 506</wicri:noRegion>
<wicri:noRegion>BP 239</wicri:noRegion>
<wicri:noRegion>Vandœuvre-Lès Nancy 54 506</wicri:noRegion>
</affiliation>
</author>
</titleStmt>
<publicationStmt><idno type="wicri:source">INIST</idno>
<idno type="inist">524-99-13508</idno>
<date when="1998">1998</date>
<idno type="stanalyst">FRANCIS 524-99-13508 INIST</idno>
<idno type="RBID">Francis:524-99-13508</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000059</idno>
<idno type="wicri:Area/PascalFrancis/Curation">000070</idno>
<idno type="wicri:Area/PascalFrancis/Checkpoint">000066</idno>
<idno type="wicri:explorRef" wicri:stream="PascalFrancis" wicri:step="Checkpoint">000066</idno>
<idno type="wicri:doubleKey">1291-1542:1998:Bruneseaux F:noms:propres:syntagmes</idno>
<idno type="wicri:Area/Main/Merge">000433</idno>
<idno type="wicri:Area/Main/Curation">000403</idno>
<idno type="wicri:Area/Main/Exploration">000403</idno>
<idno type="wicri:Area/France/Extraction">000045</idno>
</publicationStmt>
<sourceDesc><biblStruct><analytic><title xml:lang="fr" level="a">Noms propres, syntagmes nominaux, expressions référentielles : repérage et codage</title>
<author><name sortKey="Bruneseaux, F" sort="Bruneseaux, F" uniqKey="Bruneseaux F" first="F." last="Bruneseaux">F. Bruneseaux</name>
<affiliation wicri:level="1"><inist:fA14 i1="01"><s1>Centre de recherche en informatique de Nancy (CRIN), Bâtiment LORIA, BP 239</s1>
<s2>Vandœuvre-Lès Nancy 54 506</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
<country>France</country>
<wicri:noRegion>Vandœuvre-Lès Nancy 54 506</wicri:noRegion>
<wicri:noRegion>BP 239</wicri:noRegion>
<wicri:noRegion>Vandœuvre-Lès Nancy 54 506</wicri:noRegion>
</affiliation>
</author>
</analytic>
<series><title level="j" type="main">Cahiers d'études et de recherches francophones. Langues</title>
<idno type="ISSN">1291-1542</idno>
<imprint><date when="1998">1998</date>
</imprint>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt><title level="j" type="main">Cahiers d'études et de recherches francophones. Langues</title>
<idno type="ISSN">1291-1542</idno>
</seriesStmt>
</fileDesc>
<profileDesc><textClass><keywords scheme="KwdEn" xml:lang="en"><term>Corpus annotation</term>
<term>Natural language processing</term>
<term>Proper Name</term>
<term>Reference</term>
<term>Standardization</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr"><term>Traitement automatique des langues naturelles</term>
<term>Nom propre</term>
<term>Syntagme nominal</term>
<term>Référence</term>
<term>Annotation de corpus</term>
<term>Type de texte</term>
<term>Standardisation</term>
<term>Français</term>
<term>Codage</term>
<term>SGML</term>
<term>TEI</term>
</keywords>
<keywords scheme="Wicri" type="topic" xml:lang="fr"><term>Codage</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front><div type="abstract" xml:lang="fr">Parmi les avantages qu'offre la version informatisée d'une ressource linguistique, il y a, entre autres, la possibilité d'enrichir le document d'annotations spécifiques qui ne se limitent pas à un simple repérage de début/fin de sections ou de paragraphes. Dans cet article, nous aborderons plus précisément le problème du repérage et du codage des noms propres, syntagmes nominaux et expressions référentielles. Cependant, si l'annotation des noms propres peut être intéressante à des fins multiples (résumés automatiques, recherche dans des bases de données, etc.), on verra que dans les faits un tel travail suppose une bonne réflexion sur ce que l'on doit effectivement coder. C'est pourquoi, en nous appuyant sur les recommandations de la TEI (Text Encoding Initiative), nous faisons des propositions afin d'aller au-delà des possibilités actuelles et d'offrir ainsi un schéma qui permette d'affiner le codage en fonction du niveau d'analyse auquelle nom propre est appréhendé, distinguant entre nom propre élément d'un syntagme nominal ou d'une expression référentielle.</div>
</front>
</TEI>
<affiliations><list><country><li>France</li>
</country>
</list>
<tree><country name="France"><noRegion><name sortKey="Bruneseaux, F" sort="Bruneseaux, F" uniqKey="Bruneseaux F" first="F." last="Bruneseaux">F. Bruneseaux</name>
</noRegion>
</country>
</tree>
</affiliations>
</record>
Pour manipuler ce document sous Unix (Dilib)
EXPLOR_STEP=$WICRI_ROOT/Wicri/Ticri/explor/TeiVM2/Data/France/Analysis
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 000045 | SxmlIndent | more
Ou
HfdSelect -h $EXPLOR_AREA/Data/France/Analysis/biblio.hfd -nk 000045 | SxmlIndent | more
Pour mettre un lien sur cette page dans le réseau Wicri
{{Explor lien |wiki= Wicri/Ticri |area= TeiVM2 |flux= France |étape= Analysis |type= RBID |clé= Francis:524-99-13508 |texte= Noms propres, syntagmes nominaux, expressions référentielles : repérage et codage }}
This area was generated with Dilib version V0.6.31. |